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Jogos 


Formulando e resolvendo o 
problema 
* 2 jogadores, revezam o lance, são adversários 


* Formulação 
— Estado inicial: posições do tabuleiro + de quem é a vez 
— Estado final: posições em que o jogo acaba 
— Operadores: jogadas legais (=válidas) 
— Função de utilidade: valor numérico do resultado (pontuação) 


* Busca: algoritmo minimax 





— Idéia: maximizar a utilidade (ganho) supondo que o adversário 
vai tentar minimizá-la. 





— Minimax faz busca cega em profundidade. 


— O agente é MAX e o adversário é MIN. 


Jogo da velha (min-max) 
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Jogos: considerações gerais 


* Aplicações atrativas para métodos IA desde o 
início. 
— Formulação simples do problema (ações bem definidas) 
— Ambiente totalmente observável (geralmente); 
— Abstração (representação simplificada de problemas reais); 
— Sinônimo de “inteligência”; 
* Primeiro algoritmo para xadrez foi proposto por Claude 
Shannon na década de 50. 
* Porém desafiador: 
— Tamanho + limitação de tempo (351ºº nós para xadrez); 
— Incerteza devido ao outro jogador; 


— Problema “contingencial”: agente deve agir antes de 
completar a busca 


Algoritmo Minimax 


O Russel and Norvig, AIMA slides 


function MINIMAX-DECISION (state) returns an action 
inputs: state, current state in game 


return the a in ACTIONS(state) maximizing MIN-VALUE(RESULT(a, state)) 





function Max-VALUE(state) returns a utility value 
if TERMINAL-TEST(state) then return UTILITY (state) 
ve —oo 
for a, s in SUCCESSORS(state) do v— MAx(v, MIN-VALUE(s)) 
return v 


function MIN-VALUE(state) returns a utility value 
if TERMINAL-TEST(state) then return UTILITY (state) 
ve 00 
for a, s in SUCCESSORS(state) do v— MIN(v, MAx-VALUE(s)) 
return v 


Minimax 
* Passos: 

— Gera a árvore inteira até os estados terminais (ganha, 
perde ou empata). 

— Aplica a função de utilidade nas folhas. 

— Propaga os valores dessa função subindo a árvore 
através do minimax. 

— Determinar qual a ação que será escolhida por MAX. 


Jogada decidida 


Críticas 


* Problemas 


— Tempo gasto para determinar a decisão ótima é 
totalmente impraticável (ir até as folhas), porém o 
algoritmo serve como base para outros métodos mais 
realísticos. 


— Complexidade: O(b”) — idem Busca em Profundidade. 
* Para melhorar 


1) Limitar a profundidade da busca e substituir função 
de utilidade por função de avaliação (heurística); 


2) Podar a árvore onde a busca seria irrelevante: poda 
alfa-beta 


Uso da Função de Avaliação 





a 
| 
5-6=-15-5=05-6=-16-6=04-6=-2 


Figure 4.17 | Two-ply minimax applied to the opening 
move of tic-tac-toe. 


Poda Alpha-Beta 


O Russel and Norvig, AIMA slides 


function ALPHA-BETA-SEARCH (state) returns an action 
inputs: state, current state in game 
vt- Max-VALUE(state, —00, +00) 
return the action in SUCCESSORS (state) with value u 


function Max-VALUE(state, a, 3) returns a utility value 
inputs: state, current state in game 
a, the value of the best alternative for MAX along the path to state 
, the value of the best alternative for MIN along the path to state 
if TERMINAL-TEsT(state) then return UriLrry(state) 
vt-—oo 
for a, s in SUCCESSORS(state) do 
ve Max(v, MIN-VALUE(s, a, 8)) 
if v > 8 then return v 
ae Max(a, v) 
return v 
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Função heurística para o jogo da 


O tem 5 possibilidades 








Poda Alpha-Beta 


m Objetivo: não expandir desnecessariamente nós durante 
o minimax. 


E Idéia: não vale a pena piorar, se já achou algo melhor. 


m Mantém 2 parâmetros: 
* o — melhor valor (no caminho) para MAX 
* B — melhor valor (no caminho) para MIN 


m Teste de expansão: 
* a não pode diminuir (não pode ser menor que um 
ancestral) 
* B não pode aumentar (não pode ser maior que um 
ancestral) 


Poda Alpha-Beta 


O Russel and Norvig, AIMA slides 


function MIN-VALUE(state, a, 8) returns a utility value 
inputs: state, current state in game 
a, the value of the best alternative for MAX along the path to state 
8, the value of the best alternative for MIN along the path to state 


if TERMINAL-TEsT(state) then return UriLrry(state) 
vt-+oo 
for a,s in SUCCESSORS(state) do 
ve Min(v, Max-VALUE(s, à, 8)) 
if v <a then return v 
Be Min(8,v) 
return vu 


Poda Alpha-Beta: exemplo —| 


Início: Inicia valores a (max) e B (min). 





Poda Alpha-Beta: exemplo — Il 


Continua expansão de B : folha com 12 > 3 (B não muda 
seu máximo), depois folha com 8>3 (B não muda seu 
máximo). B não tem mais filhos, portanto 3, = 3 e a do pai 
pode ser iniciado. Continua expansão, com a limitando a 
busca. 


Valor de, no mínimo... (só pode aumentar) 


Poda Alpha-Beta: exemplo — IV 


Expande D: folha com 14, atualiza B; s 14 e como 14>a. e 
B3 ainda pode diminuir, continua a expansão de D. Folha com 
5, reduz Bs e como 5 > a e 3 ainda pode diminuir, continua a 
expansão de D. Última folha tem 2: define valor de ps = 2 e 
verifica se atualiza a; como a > 2, ele não muda e a busca 
termina. 
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Poda Alpha-Beta: exemplo —| 


Expande até 1º folha e aplica função utilidade, atualizando o 
máximo valor que o B de B pode ter (já que é um nó de 
MIN). Precisa continuar procurando para ver se ainda é 
reduzido. 


Valor de, no máximo... (só pode diminuir) 


Poda Alpha-Beta: exemplo — III 


Expande C: folha com 2, atualiza B, = 2. Como 2 <a do nó 
pai, € não precisa mais ser expandido. Deve-se verificar se B3 > 
3 para mudar a. 

Justificativa: se novo filho de C tiver valor MAIOR que 2, como 
B> não pode aumentar, nada será mudado; se novo filho tiver 
valor MENOR que 2, B» reduzirá mas não afetará a, que só pode 
aumentar e já está com valor À 

qz3 /A 


Poda Alpha-Beta: exemplo — IV 


Busca termina, com escolha da jogada B. 


Jogada escolhida 


Exercício 


Decidir a jogada de MAX (A, Bou €) considerando as 
utilidades fornecidas nas folhas. Adotando a poda alfa- 
beta, indicar quais arestas/subárvores serão podadas. 


Exercício 


Exercício 


Exercício 


Exercício 


Exercício 
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Exercício Exercício 


Exercício Exercício 


Exercício Exercício 
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Exercício Exercício 


Exercício Exercício 
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Exercício Exercício 
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Exercício Exercício 


Exercício Exercício 


Exercício Exercício 
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Exercício Exercício 


Exercício Exercício 


Exercício Exercício 
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Exercício Exercício 


Exercício Exercício 


Exercício Exercício 
Jogada eseolhida 





